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摘要 : [目的 /意义 ] 社会 化 标签 是 我 国 图 书 情报 与 数字 图 书馆 学 科 领 域 的 研究 热点 ,在 近 几 年 的 发 展 过 程 
中 ,对 于 标签 的 研究 范围 拓展 至 信息 质量 、 信 息 检索 、 信 息 推 荐 等 多 个 图 情 研究 领域 ,对 图 情 学 科 标 签 研 究 进 展 
的 分 析 或 评述 将 为 “社会 化 标签 "未 来 的 发 展 研究 提供 依据 。[ 方 法 /过 程 ] 选取 2010 年 至 2017 年 间 的 图 情 领 
域 期 刊 文献 ,利用 CiteSpace 可 视 化 剖析 社会 化 标签 研究 热点 发 展 进程 研究 趋势, 并 从 标签 应 用 、 标 签 信息 、 
标签 质量 、 信 息 推荐 、 信 息 检索 5 个 角度 对 主题 研究 进行 分 析 总 结 。[ 结果 /结论 ] 基于 社会 化 标签 研究 现状 及 
问题 提出 相关 建议 ,如 拓展 标签 在 本 体 、 信 息 检索 层面 的 研究 范围 ,以 用 户 为 中 心 适 应 个 性 化 需求 ,将 研究 成 果 
应 用 于 实践 等 。 
二 关键 词 : 社会 化 标签 “图 书馆 学 ”情报 学 
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的 语义 描述 ,作用 于 对 Web 资源 的 分 类 组织 和 检索 。 


ee cc 社会 化 标签 反映 了 客观 信息 和 用 户 的 主观 认 知 ,是 用 
近年 来, 随 着 互联 网 技术 的 日 关 成 熟 , 越 来 越 多 的 。 户 灾 现 容 源 组织 管理 和 此 这 的 基础 、 在 大 众 术 注 过 
福 涡 资源 被 数据 化 ,人 们 有 了 更 多 的 渠道 方式 获取 信 ae 
上 二 分 类 秆 全 全 人 十 冰 与 日 候 由 ， 有 中间 分 程 中 ,标签 对 信息 资源 进行 了 关键 记分 类 信息 描述 、 
六 宝生 于 下 月 交 网 红 平 台 是 本 华 类 同时 Dllias 注释 添 加 元 数据 等 ,体现 了 社会 化 标签 所 包含 的 客观 
, 二 口 小 全 ) 1C1 ? 、 四 -> A | ?十 会 

官 这 许 用 户 对 网 站 或 网 页 内 容 添 加 标签 ,以 实现 网 站 。 入 居 让 允 于 生 之 站 站 实 下 各 个。 国门 生生 国生 合作 
的 其间 和 自 组 织 。Dalicious 对 资源 分 闫 权限 的 油 “， 标 签 网 站 包括 豆瓣 网 \ 微 博 、 知 笠 等 ,作为 用 户 原创 内 
束 到 得 用 户 作为 信息 接收 者 的 同时 ,也 成 为 信息 的 生 。。 容 (Tser Cenerated Content, DGC) 产物 ,社会 化 标签 可 
严 竖 措 述 者 .组 织 者 和 共享 者 。 相 较 于 传统 的 信息 组 。 个 了 社会 公众 对 信息 的 理解 写 认识 ,增强 了 用 户 写 互 
全 的 六 这 种 将 用 户 标注 作为 位 自 次 源 分 类 的 方式 极 。 联网 信息 之 间 的 联系 ,为 信息 个 性 化 服务 .信息 分 类 、 
大 促进 了 信息 的 社会 化 ,为 信息 个 性 化 需求 指明 了 新 信息 推荐 信息 行为 薛 研 究 及 应 用 芝 来 了 重 妥 的 数据 
的 发 展 方向 。 T. Vander Wal 于 2004 年 提出 Folkson- 资源 。 社会 化 标签 在 政府 、 企 业 、 商 业 教育 个人、 其 
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omy 的 概念 , 意 为 大 众 分 类 法 ,并 将 其 划分 为 广义 自由 ”他 公益 类 网 站 都 有 所 应 用 ,利用 社会 化 标签 ,人 们 可 以 


分 类 法 和 狭义 自由 分 类 法 两 种 ,狭义 与 广义 的 区 分 在 对 网 络 资源 进行 收集 标记 、 分 类 组 织 、 分 享 推荐 ,通过 


于 标注 者 在 知识 结构 .兴趣 领域 上 同 质 与 否 。 在 此 基 ”标签 浏览 检索 .评价 ` 添 加 、\ 传 播 `. 共 学 等 活动 即 可 实 
础 上 ,出现 了 “社会 化 标签 “社会 化 标注 “社会 编目 ” ” 现 信息 素 养 的 全 面 发 展 ”。 


“社会 元 数据 "等 术语 ,这 类 标注 术语 的 兴起 体现 了 社 此 外 ,标签 还 可 用 于 信息 检索 .数据 可 视 化 .个 性 
会 化 标签 的 分 类 本 质 。 化 服务 .知识 挖掘 等 应 用 领域 ,是 应 用 领域 极其 广泛 、 


社会 化 标签 是 用 户 基于 个 人 认 知 对 信息 资源 添加 ”研究 范围 拓展 度 极 高 的 主题 词 。 
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2 研究 背景 


2.1 研究 问题 的 提出 

由 于 生活 背景 .信息 素养 .学 科 知识 等 条 件 的 不 
同 ,由 用 户 创建 的 社会 化 标签 具有 形式 随意 性 、 主 观 
性 ,不 确定 性 等 特点 ,标签 特性 使 其 在 信息 检索 .分 类 、 
推荐 等 具体 应 用 过 程 中 产生 质量 不 均 、 效 率 低下 等 问 
题 。 为 了 更 好 地 利用 社会 化 标签 ,适应 用 户 获取 和 消 
费 信息 的 需求 ,学 术 界 对 社会 化 标签 的 研究 由 对 标签 
的 实践 应 用 、 理 论 探讨 拓展 至 与 应 用 相关 联 的 科学 研 
究 ,包括 可 视 化 标签 表示 .信息 推荐 标签 质量 等 。 作 
为 网 络 资源 信息 组 织 的 新 形式 ,社会 化 标签 研究 领域 
的 拓展 使 得 标签 引 发 越 来 越 多 的 关注 ,成 为 图 书 与 情 
报 学 领域 的 研究 热点 。 通 过 文献 调查 ,图 情 领域 相关 
学 考 对 “社会 化 标签 ”的 研究 主要 集中 在 信息 检索 , 信 
局 孜 兴 .标签 表示 ,知识 网 络 等 领域 , 鲜 有 对 图 情 学 科 
左 谨 内 的 社会 化 标签 研究 情况 的 加 以 探讨 。 学 科 知 识 
导 研究 框架 的 相互 作用 影响 着 专家 学 者 对 社会 化 标签 
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Hi 区 问题 的 研究 效果 ,掌控 专业 领域 内 的 专题 研究 赵 
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势 或 情况 将 有 利于 专家 学 者 对 社会 化 标签 研究 走向 的 
掌控 ,推进 信息 科学 的 发 展 。 笔 者 选取 图 情 领 域 的 “ 社 
会 化 标签 "期 刊 文献 ,对 研究 热点 、 研 究 现状 进行 探讨 
分 析 , 进 而 从 更 宏观 层面 了 解 该 领域 对 “社会 化 标签 ” 
的 研究 情况 。 
2.2 ”研究 对 象 的 选择 

本 人 研究 以 “标签 ”“Folksonomy”“ Social Tag” 作 为 
检索 词 , 从 中 国 知 网 .Sci-Hub 检索 我 国 图 书 情报 与 数 
字 图 书馆 学 科 领 域 期 刊 文献 ,年 限 设置 为 2010 年 至 
2017 年 ,在 别 除 非 相 关 文献 后 , 共 提 取出 132 篇 较 具 代 
表 性 的 社会 化 标签 主题 文献 。CiteSpace 通过 文献 关键 
词 聚 类 以 时 间 线 视图 的 形式 展示 主题 文献 及 各 个 子 领 
域 的 研究 演进 过 程 , 各 节点 半径 体现 关键 词 出 现 频次 ， 
节点 间 连 线 表 示 存 在 共 现 关系 ,节点 按 颜色 色 度 变化 
展示 不 同年 份 , 蓝 色 代表 较 早 的 年 份 ,红色 代表 最 近年 
份 ”。 笔 者 选择 此 方法 对 “社会 化 标签 ”的 期 刊 文献 
进行 初步 分 析 ,关键 词 时 间 线 视图 如 图 1 所 示 : 


#3 社会 标签 


1 关键 词 时 间 线 视图 


由 图 1 可 知 ,在 样本 文献 中 ,标签 、Folksonomy 、 社 
会 化 标签 是 出 现 频 次 较 高 的 关键 词 。 最 早 的 “社会 化 
标签 ”的 期 刊 文献 发 布 于 2011 年 左右 ,研究 文献 量 在 
2012 年 达到 高 峰 ,研究 内 容 包 括 个 性 化 本体 标签 质 
量 \ 主 题 图 社会 化 标注 、 大 众 分 类 法 等 ;与 “社会 化 标 
签 ” 相 关联 的 “Folksonomy” 人 研究 领域 探讨 了 信息 组 织 、 
学 科 导 航 .标签 推荐 .复杂 网 络 .知识 网 络 领域 知识 等 
内 容 ; 相 关 的 “标签 " 则 探讨 了 标签 检索 标签 云 .标签 
本 体 、 分 众 分 类 法 等 ;社会 标签 主要 研究 图 书馆 、 主 题 
词 .规范 性 方面 的 内 容 。 


时 


关键 词 共 现 网 络 分析 也 称 作 共 词 分 析 , 通 过 分 析 


文本 内 容 信息 获取 共同 出 现 的 关键 词 ,以 探索 学 科 领 
域 中 相关 主题 的 关联 关系 。 在 关键 词 共 现 网 络 图 中 ， 
圆圈 越 大 代表 关键 词 出 现 频次 越 多 ,关键 词 共 现 情况 
体现 了 关键 词 的 中 心性 ,中 心性 较 高 的 关键 词 在 共 现 
网 络 中 影响 力 越 大 ,根据 关键 词 出 现 频次 及 中 心性 情 
况 可 以 了 解 文献 主题 的 研究 热点 分 布 情况 。 通 过 相关 
文献 调查 分 析 , 我 国 图 情 领 域 学 者 对 社会 化 标签 的 分 
析 研 究 领 域 跨度 较 广 ,涵盖 自然 科学 、 社 会 科学 、 人 文 
科学 等 多 个 研究 领域 。 根 据 图 2 的 关键 词 共 现 网 络 ， 
可 知 “Folksonomy” 与 “标签 "关键 词 共 现 频 次 最 高 , 样 
本 文献 中 有 5 次 。 通 过 关键 词 标签 聚 类 可 知 ,标签 与 
信息 组 织 ,信息 检索 、 标 注 系 统 , 本 体 等 多 个 研究 领域 
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关系 紧密 ,并 与 Folksonomy 社会 标签 等 话题 点 构成 社 
会 化 标签 研究 网 络 的 主体 部 分 。 与 社会 化 标签 研究 相 
关 的 复杂 网 络 ,标签 推荐 .本体 .个 性 化 .标签 质量 、 标 
签 聚 类 标签 检索 等 是 我 国 图 情 领 域 社会 化 标签 的 研 
究 热点 。 


标签 质量 


蒜 签 采 类 
2 关键 词 共 现 网 络 示意 


2 多 研究 框架 

@ 〇 通过 阅读 文献 和 社会 化 标签 研究 热点 分 布 情况 可 
第 , 燃 签 云 .主题 图 .图 书馆 .学 科 导 航 、 社 会 化 标注 系 
统 等 关键 词 体现 了 社会 化 标签 的 实际 应 用 ;复杂 网 络 、 
敌 遍 网 络 ,信息 组 织 .标签 本 体 、 主 题词 .领域 知识 是 标 
签 并 息 研究 的 内 容 ;标签 质量 .规范 性 是 标签 质量 研究 
的 省 题 点 ;由 于 样本 文献 主要 针对 社会 化 标注 系统 进 
行 覆 究 ,因此 将 个 性 化 .标签 推荐 归纳 入 信息 推荐 的 相 


将 标签 引入 图 书馆 学 领域 是 在 2007 年 ,典型 的 应 用 系 
统 如 宾夕法尼亚 大 学 图 书馆 的 社会 标签 系统 
PennTags 、 密 葡 根 大 学 的 MTagger、 中 山大 学 图 书馆 系 
统 。 我 国 图 情 领 域 关 于 社会 化 标签 的 应 用 研究 ,主要 
是 对 高 校 图 书馆 的 标签 应 用 研究 。 薛 娟 ”将 Tag 技术 
应 用 于 学 科 建 设 服务 中 ,设计 并 实现 了 基于 社会 化 标 
签 的 高 校 图 书馆 学 科 信 息 导航 系统 ,优化 了 学 科 资源 
的 共 建 与 共享 体系 ; 刘 向 红 "将 标签 引入 非 物质 遗产 
资源 展示 平台 ,结合 大 众 标注 与 非 遗 的 传统 列表 方式 ， 
构建 社会 化 非 遗 数据 库 , 以 尽量 多 层面 地 展示 文化 资 
源 ,增强 用 户 体验 ,拓展 了 社会 化 标签 在 文化 领域 的 应 
用 形式 。 

社会 化 标签 不 仅仅 是 科研 领域 的 研究 热点 ,其 可 
视 化 形式 一 一 标签 云 主题 图 等 在 学 术 研究 、 网 络 平台 
等 领域 也 得 到 了 广泛 应 用 。 沈 奎 林 等 ”综合 读者 的 文 
献 需求 及 馆藏 文献 特点 ,以 标签 云 的 形式 展示 研究 文 
献 的 关键 词 ,提供 了 更 人 性 化 的 图 书 检 索 和 信息 服务 
方式 。 也 有 学 者 通过 提取 社交 网 络 数据 构建 标签 云 
,进行 相关 功能 的 拓展 或 优化 。 例 如 , 毕 强 等 “选取 
豆 办 网 中 图 情 领 域 图 书 标签 数据 绘制 标签 云图 ,展示 
标签 资源 的 聚合 结果 ,结合 社会 网 络 分 析 方法 挖掘 标 
签 语义 及 层级 关系 ,拓展 了 社会 化 标注 系统 的 资源 聚 
合 维度 ; 陈 婷 等 ”结合 社会 化 标签 和 主题 图 实现 了 领 
域 知识 有 序 结构 的 可 视 化 ,构建 了 结构 化 的 知识 语义 
网 络 及 语义 标签 资源 导航 ,揭示 了 标签 主题 词 间 的 关 
联 , 弥 补 了 标签 云 在 信息 展示 层面 的 缺陷 。 
3.2 标签 应 用 的 模式 

标签 应 用 模式 可 分 为 结合 式 .内 艇 式 、 混 合式 、 延 


关内 容 。 综 合 对 社会 化 标签 的 相关 人 研究 ,笔者 将 从 标 
签 应 用 、 标 签 信息 ,标签 质量 \ 信 息 推荐 \ 信 息 检索 5 个 
研究 角度 对 目前 我 国 图 书 情报 与 数字 图 书馆 学 科 领 域 
的 社会 化 标签 研究 情况 进行 探讨 ,以 求 更 进一步 了 解 
社会 化 标签 在 当前 学 科 背景 下 的 发 展 动向 。 


3 ”社会 化 标签 的 应 用 研究 


我 国 图 情 领 域 对 社会 化 标签 的 应 用 研究 主要 集中 
在 2012 至 2014 年 间 ,通过 文献 分 析 , 笔 者 将 从 标签 应 
用 的 领域 .模式 ,管理 对 社会 化 标签 的 应 用 研究 情况 进 
行 概述 。 
3.1 标签 应 用 的 领域 

随 着 Web2.0 信息 技术 的 发 展 ,社会 化 标签 在 教 
育 文化 .科研 技术 等 领域 都 得 到 了 广泛 的 应 用 和 发 
展 。 在 教育 领域 ,图 书馆 是 主要 的 标签 应 用 场景 ,最 早 
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伸 式 4 种 应 用 模式 。 冯 倩 然 等 ”基于 图 书馆 图 书 标签 
应 用 场景 对 4 种 应 用 模式 进行 介绍 。 结 合式 应 用 模式 
特 指 将 图 书 书目 与 社会 化 标签 相 结合 ,构建 社会 书目 
系统 ;内 骨 式 应 用 模式 指 的 是 将 标签 引入 到 图 书馆 服 
务 中 ,发 挥 社 会 化 标签 的 作用 ,增加 图 书 资源 建设 中 的 
用 户 参 与 度 ; 混 合式 应 用 模式 即 结合 多 种 标签 应 用 模 
式 ,丰富 图 书 书目 系统 ;延伸 式 应 用 模式 指 的 是 借助 成 
熟 的 社会 化 标签 网 站 ,扩大 图 书馆 服务 广度 及 深度 。 

标签 可 以 有 效 揭示 数字 学 术 资源 内 容 , 当 前 大 学 
图 书馆 中 Folksonomy 的 应 用 集中 在 联机 搜索 和 图 书 分 
类 领域 。 高 校 图 书馆 引入 标签 主要 采取 舱 入 式 服 务 模 
式 , 即 在 图 书馆 集成 管理 系统 中 能 入 标签 ,利用 标签 进 
行 用 户 自主 标注 和 检索 ,以 标签 链接 方式 定位 资源 等 。 
延伸 式 服务 模式 也 是 应 用 的 一 种 , 即 借助 社会 标签 将 
图 书馆 的 服务 辐射 出 去 。 
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3.3 ”标签 应 用 的 管理 
学 者 们 主要 从 图 书馆 标签 应 用 角度 研究 了 标签 应 
用 的 管理 问题 。 郑 燃 " 构 建 了 基于 Folksonomy 应 用 的 
图 书馆 信息 组 织 模型 ,以 实现 良好 的 数据 处 理 体系 。 
林 婷 5 通过 对 112 所 “211" 工 程 高 校 进行 实例 调查 ， 
运用 经 典 扎根 理论 ,总 结 了 我 国 高 校 图 书馆 Folkson- 
omy 的 管理 机 制 ,包括 运行 机 制 .动力 机 制 .约束 机 制 。 
由 于 网 络 活动 方式 的 多 样 性 、 用 户 与 管理 者 身份 的 双 
重型 .技术 平台 的 非 单一 性 ,图 书馆 标签 运行 机 制 钳 入 
了 社会 网 络 的 管理 方法 ,呈现 多 样 性 的 特征 。 在 用 户 
社会 心理 驱动 管理 主体 的 拉动 性 与 推动 性 的 作用 下 ， 
图 书馆 标签 管理 的 动力 机 制 呈现 出 标签 拉动 性 利益 未 
受 重视 ,推动 性 利益 依赖 于 系统 商 的 情况 。 而 对 于 图 
书 资源 标签 的 约束 则 主要 来 自用 户 自身 ,在 权利 约束 
方 丁 并 不 明显 。 
社会 化 标签 揭示 了 信息 资源 的 内 容 或 关联 信息 ， 
汶 仿 息 组 织 检索 提供 了 新 的 应 用 方式 。 但 标签 在 
OERC 上 的 应 用 尚 处 于 摸索 和 完善 阶段 ,其 自身 的 不 
爱护 ,无 结构 .语句 问题 等 ,使 它 并 未 广泛 应 用 于 图 书 
饶 宁 如 何 更 好 地 匹配 不 同学 科 或 群体 ,需要 图 书馆 及 
其 他 相关 学 术 研究 领域 构建 更 完善 的 信息 管理 模式 。 


4 社会 化 标签 的 信息 研究 


一 


.全 研究 者 们 主要 从 复杂 网 络 .本体 、 聚 类 等 角度 对 标 
种 伴 息 进行 研究 ,以 探讨 标签 间 的 关系 与 深层 语义 信 
6 为 各 种 信息 服务 提供 规范 化 的 数据 基础 。 
4: 旺 标签 信息 研究 
@ 由 于 用 户 标注 的 随意 性 ,社会 化 标签 具有 一 词 多 
义 等 特性 ,使 得 标签 的 搜索 准确 率 降低 。 研 究 者 们 利 
用 知识 组 织 工具 ,统计 方法 或 数学 模型 ,引入 标签 消 歧 
机 制 ,以 挖 气 标 签 的 真实 信息 。 窦 玉 萌 "" 将 标签 消 歧 
方法 分 为 基于 数据 挖掘 方法 .基于 统计 分 析 方法 、 利 用 
相关 知识 组 织 工具 .引入 控制 机 制 和 开发 可 视 化 组 件 
消 靶 5 类 ,并 从 用 户 参与 度 、 消 歧 时 机 、 消 歧 性 质 、 实 验 
与 应 用 情况 ,发 展 前 景 方面 进行 比较 分 析 , 指 出 可 视 化 
组 件 消 战 方法 具有 较 好 的 发 展 前 景 。 

标签 本 体 体现 了 标签 .用户 .资源 之 间 的 关系 ,并 
被 广泛 应 用 于 标签 信息 表示 研究 上 。 祝 贺 "” 通过 分 
析 标签 本 体 多 元 标注 形式 ,在 研究 本 体 构建 方法 基础 
上 ,提出 了 骨架 法 标签 本 体 构建 方法 ,为 标签 本 体 的 应 
用 扩展 做 出 了 理论 研究 。 窦 永 香 等 中 通过 对 本 体 和 社 
会 化 标签 文献 的 关联 研究 情况 的 可 视 化 分 析 ,指出 本 
体 与 社会 化 标签 关联 多 个 学 科 领域 ,包括 知识 共享 . 语 
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义 网 、 用 户 生 成 内 容 、 标 签 本 体 , 标 签 推荐 等 。 白 华 ™ 
采用 标签 一 一 概念 映射 和 集成 技术 把 标签 映射 到 概念 
框架 中 ,从 而 构建 兼 有 大 众 分 类 和 概念 本 体 特征 的 新 
本 体 , 在 本 体 容纳 性 、 灵 活性 、 多 向 语义 关联 方面 都 显 
著 优 于 传统 分 类 线性 结构 。 大 众 分 类 对 知识 组 织 系统 
和 其 他 本 体 的 影响 主要 体现 在 三 个 方面 ,包括 资源 决 
定 体 系 、 用 户 因素 .分布 式 资源 和 用 户 标注 造成 的 语义 
难题 ,所 以 基于 语义 规则 聚合 内 容 成 为 关联 本 体 中 不 
同 标签 的 关键 手段 。 白 华 ” 结合 大 众 分 类 本 体 和 一 
般 概 念 本 体 ,构造 一 个 以 概念 为 中 心 的 集成 本 体 ,成 为 
整合 个 人 标签 和 知识 框架 及 语义 信息 组 织 中 较 好 的 方 
法 。 

社会 化 标签 系统 中 的 标签 共 现 关 系 揭 示 了 标签 的 
语义 特征 。Folksonomy 中 用 户 标签 个 体 间 的 语义 紧密 
程度 接近 于 随机 网 络 的 自由 松散 化 分 布 特征 ,整体 的 
语义 关系 方面 拥有 趋 近 于 领域 本 体 的 较 高 的 语义 紧密 
程度 "” 。 李 正宗 等 "提出 基于 综合 共 现 相 似 度 的 标 
签 共 现 谱 聚 类 方法 ,通过 基于 标签 共 现 关 系 的 标签 聚 
类 ,精确 刻画 出 标签 语义 的 相似 性 ,有 效 揭示 了 标签 的 
潜在 主题 .概念 及 语义 结构 。 
4.2 ”标签 间 关 系 研究 

标签 所 具有 的 丰富 语义 使 得 标签 间 具 有 多 种 关 
系 ,如 标签 共 现 关系 .同义词 关系 、 上 下 术语 关系 .相关 
关系 等 ,加 强 对 标签 间 的 属性 .关系 的 挖掘 有 利于 完善 
标签 资源 聚合 体系 ,实现 标签 资源 的 优化 重组 。 基 于 
本 体 的 标签 间 语 义 关系 的 研究 ,弥补 了 社会 化 标签 在 
语义 准确 度 ,信息 智能 处 理 的 不 足 。 丁 婉 蒙 "综合 
户 标签 在 构建 受 控 词 表 和 提供 个 性 化 服务 方面 的 优 
势 , 提 出 了 一 种 基于 用 户 标签 的 个 人 本 体 构建 的 流程 ， 
规范 了 用 户 标签 的 词汇 . 词 间 关 系 ; 陈 开 燕 (中 构造 了 
本 体 和 分 众 分 类 融合 模型 ,以 提高 标签 资源 检索 性 能 ; 
能 回 香 、. 王 学 东 " ”通过 探讨 标签 概念 空间 与 领域 本 体 
间 的 映射 机 制 ,实现 了 对 标签 的 语义 组 织 ,优化 了 社会 
化 标签 导航 及 搜索 机 制 。 

标签 共 现 是 在 大 规模 信息 资源 的 集合 中 ,通过 该 
语义 关联 和 内 容 关联 来 挖掘 有 相关 联系 的 标签 1。 
研究 者 结合 标签 共 现 与 社会 网 络 分 析 方 法 对 标签 关系 
进行 分 析 。 李 亚 婷 等 ”通过 对 CiteUlike 数据 进行 实 
证 研究 ,构建 了 以 标签 为 单位 的 共 现 网 络 ,分 析 认 为 标 
签 共 现 网 络 呈 现 “ 小 世界 现象 ”与 “无 标 度 特征 ”, 并 提 
出 构建 资源 的 关联 网 络 ,以 此 优化 基于 标签 的 信息 资 
源 推荐 ; 商 宪 丽 等 ”通过 对 学 术 博 客 标签 资源 进行 社 
会 网 络 分 析 , 指 出 学 术 博 客 博文 资源 之 间 的 社会 网 络 
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性 质 ,包括 “小 世界 特性 "和 “无 标 度 网 络 "性 质 。 

社会 网 络 分 析 法 (SNA ) 通过 对 标签 关联 关系 的 控 
据 和 和 群 组 划分 ,表现 出 极 强 的 逻辑 性 、 层 次 性 和 整体 
性 。 在 样本 文献 中 ,Y. I，Ming 等 ”最 早 提 出 将 社会 
网 络 分 析 方法 应 用 于 标签 分 析 中 ,并 提出 4 种 类 型 的 
分 析 方法 ,包括 点 - 线 - 密度 分 析 方法 .中 心性 分 析 方 
法 .凝聚 子 群 分 析 方法 结构 化 方程 分 析 方法 ;吴江 瘦 
根据 自由 分 类 标签 和 资源 的 关系 连接 ,提出 凝聚 子 群 
分 析 构建 自动 分 类 网 络 地 图 ,以 解决 标签 等 级 结构 不 
明确 的 问题 ; 孙 中 秋 等 “采集 豆瓣 图 书 情报 学 科 图 书 
标签 数据 ,通过 对 比 研究 基于 Folksonomy 和 基于 SNA 
的 社会 化 标注 系统 标签 资源 聚合 效果 ,指出 SNA 在 实 
现 标签 资源 聚合 的 维度 .技术 效果、 应 用 上 都 更 具 优 
势 r; 易 明 等 “应 用 网 络 分 析 的 基本 原理 ,构建 了 社会 
化 棕 答 系统 中 基于 社会 网 络 的 知识 推送 网 络 演化 总 体 
模型 ,拓展 了 社会 网 络 的 研究 领域 ; 滕 广 青 等 5 采用 
复 用 网 络 分 析 方 法 构建 了 社 群 知识 网 络 中 的 知识 群 
藻 分 析出 Folksonomy 模式 中 的 知识 群落 具有 动态 
尖 属 .结构 谋 套 .知识 关联 丰富 等 特性 ; 李 锦 霞 ”通过 
梅 建 共 标签 和 关联 标签 网 络 体系 ,结合 社会 网 络 分 析 
刀 尖 得 出 数字 图 书馆 馆藏 资 源 的 主题 特征 ,为 数字 图 
要 和 衣 资源 的 管理 提供 参考 ; 刘 雅 妹 等 扩 基于 领域 知识 
网 纲 路 径 长 度 划分 标签 局 部 层级 ,从 时 间 序列 角度 对 
标签 局 部 层级 结构 的 演化 进程 进行 了 分 析 , 指 出 标签 
的 局 部 层级 结构 相 较 于 传统 知识 组 织 体系 的 内 部 关系 
更 光复 杂 多 样 , 且 随 领域 知识 的 发 展 不 断 变 迁 ,期 间 伴 
随 标 签 晋升 、 降 级 的 情况 。 
4-@) 标签 信息 行为 研究 

普通 用 户 与 专家 的 标注 行为 存在 部 分 的 一 致 性 ， 
但 由 于 专业 背景 .兴趣 爱好 、 认 知 特征 的 不 同 ,不 同 用 
户 的 标注 行为 所 引起 的 标签 间 关 系 的 差异 也 引起 了 研 
究 者 们 的 关注 ,部 分 研究 者 从 用 户 标注 行为 角度 对 标 
签 关 系 信息 进行 了 研究 。 潘 婵 等 ”通过 分 析 不 同 领 
域 标签 和 关键 词 的 相似 度 ,指出 相同 用 户 对 资源 进行 
标 引 时 ,其 标签 和 关键 词 的 相似 度 相差 不 大 ,而 受 “最 
省 力 法 则 ”“ 布 拉 德 福 定 律 " 和 “老化 定律 "的 影响 ,不 
同 领 域 的 标签 和 关键 词 相 似 度 则 有 差距 ; 李 枫 林 等 ” 
分 析 了 不 同 标注 行为 所 形成 的 标签 与 被 标注 资源 间 的 
关系 ,并 将 相关 性 分 析 用 于 计算 标签 相关 性 计算 上 ,有 
效 提 高 检索 结果 重 排 的 效果 。 

用 户 即 是 信息 组 织 者 也 是 信息 搜寻 者 。 姜 婷 婷 
等 "基于 豆 辩 网 从 信息 搜寻 角度 对 用 户 行为 进行 了 
研究 ,指出 在 社会 化 标注 系统 中 ,用 户 对 于 信息 搜索 
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般 采 取 多 种 模式 ,具有 ”多 策略 ”倾向 ,信息 偶遇 者 多 
为 访问 历史 较 短 的 新 用 户 ,关联 性 浏览 者 查看 的 资源 
数量 明显 高 于 搜索 者 。 吴 丹 等 ” 通过 对 武汉 大 学 图 
书馆 用 户 图 书 标注 行为 的 调查 ,指出 社会 化 标注 行为 
的 个 性 化 特征 ,用 户 标 注 多 源 于 对 书籍 的 归 类 及 推荐 
需求 ,更 倾向 于 使 用 标签 而 非 添 加 标签 ; 由 于 社会 化 标 
注 在 图 书馆 应 用 尚 不 普遍 ,用 户 鲜 少 关注 与 图 书 标签 
相关 的 讲座 或 公共 活动 。 

除了 对 文本 资源 的 检索 ,图 像 检索 是 用 户 获 取信 
息 资源 的 方式 之 一 ,图 像 所 具有 的 描述 属性 和 特征 影 
向 着 用 户 标注 行为 。 邓 三 鸿 等 ”基于 社会 标签 分 类 
模型 调查 分 析 了 华 特 斯 艺术 博物 馆 数 字 门 户 网 站 ,并 
指出 用 户 更 偏向 于 运用 通用 词语 描述 图 像 主 题 内 容 ， 
更 倾向 于 描述 人 或 物 的 相关 内 容 。 


5 社会 化 标签 的 质量 研究 
对 于 社会 化 标签 的 质量 研究 ， 


本 文献 中 包括 针 
量 评估 算法 或 模 
质量 的 案例 调查 


对 标签 质量 影响 因素 的 分 析 、 标 签 
型 的 研究 及 优化 ,其 他 主要 是 对 标 
分 析 。 
5.1 标签 质量 的 影响 因素 

低 质量 标签 干扰 了 社会 化 标注 系统 中 资源 组 织 的 
秩序 ,降低 了 相关 应 用 的 有 效 性 及 用 户 满意 度 。 常 见 
的 低 质量 标签 包括 :标签 过 于 主观 、 拼 写 错误 .垃圾 标 
注 等 扩 。 李 和 蕾 . 章 成 志 55 将 社会 化 标注 问题 分 为 两 
类 :用 户 标 注 行为 导致 的 质量 问题 和 标注 系统 缺乏 语 
义 规范 导致 的 质量 问题 。 标 注 行为 问题 主要 表现 在 用 
户 标注 过 于 主观 ,拼写 错误 .垃圾 标签 现象 ;语义 规范 
问题 表现 在 多 义 词 标注 .同义词 标注 问题 。 由 于 无 法 
准确 描述 资源 属性 或 主题 , 低 质 量 标签 成 为 干扰 标签 
应 用 的 重要 影响 因素 。 刘 礼 锋 、 潘 旭 伟 5 通过 构建 社 
会 化 标签 主题 模型 ,研究 了 社会 化 标注 中 用 户 标签 的 
主题 鲜明 性 ,指出 大 多 数 用 户 标签 鲜明 性 程度 介 于 极 
鲜明 与 极 模糊 之 间 ,标签 主题 的 鲜明 性 随 用 户 的 活跃 
性 增加 而 增强 。 

在 社会 化 标注 系统 中 ,用 户 标注 行为 不 受 限 制 ,加 
之 标签 规模 的 逐渐 增加 ,标签 质量 受 文 化 背景 .语言 因 
素 等 方面 的 影响 也 越 来 越 显 著 。 在 此 背景 下 ,社会 化 
标签 存在 较 多 近义词 .多 义 词 , 仅 从 语法 层面 不 足以 了 
解 标 签 的 全 部 特征 ,如 语义 特征 等 ”。 章 成 志 等 ” 指 
出 标签 质量 评估 在 多 语种 量化 分 析 研 究 上 仍 显 不 足 ; 
杜 友 桃 , 徐 晨 展 ”以 豆 辩 网 为 研究 对 象 ,从 标注 者 动 
机 和 标注 系统 层面 调查 分 析 当 前 社会 化 标签 质量 的 影 
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响 因素 ,指出 用 户 的 广泛 性 .标注 随意 性 使 得 标注 系统 
显露 诸多 缺陷 。 
5.2 标签 质量 的 评估 

标签 质量 的 评估 方法 可 分 为 人 工 评 价 和 自动 评价 
两 种 , 李 芋 等 "依据 不 同 资源 或 评估 参数 ,列举 出 质 
量 评估 的 代表 性 方法 ,包括 利用 人 工 评价 ,基于 标签 统 
计 属性 ,依据 规范 词语 ,依据 标签 和 主题 词 的 比较 , 依 
据 用 户 标签 与 专家 标注 结果 的 比较 ,依据 标签 与 文本 
内 容 关键 词 的 比较 ,基于 信息 检索 的 方式 ,基于 用 户 、 
资源 ,标签 三 者 关系 来 评估 标签 质量 ” 。 人 工 评估 标 
签 质量 准确 度 较 高 ,但 耗 时 较 长 ,难以 大 规模 应 用 实 
施 ;基于 标签 自身 属性 的 评估 可 用 于 大 规模 数据 的 质 
量 评估 ,但 未 考虑 到 用 户 标注 动机 等 其 他 因素 的 影响 ; 
依据 规范 词语 进行 隐 含 的 质量 评估 一 般 通过 对 用 户 标 
注 征 行 实时 评估 ,以 标签 推荐 .拼写 检查 .输入 提示 等 
[区 ,减少 用 户 误 输入 、 垃 圾 标签 等 问题 ;依据 标签 和 
埋 感 词 的 比较 进行 评估 是 根据 用 户 标注 与 主题 词 库 的 
下 柄 度 进 行 质量 评估 的 , 受 主题 词 更 新 速度 ,覆盖 范围 
的 虑 制 ,此 方法 的 有 效 性 并 不 稳定 ; 相 较 于 主题 词 表 ， 
基 忆 专家 标注 结果 的 评估 适应 了 实际 情况 ,可 进行 及 
时 本 新 ;依据 与 文本 内 容 关键 词 的 比较 主要 通过 抽取 
交 B 资 源 的 关键 词 , 进 行 相似 度 匹 配 ,此 方法 对 文本 关 
键 酒 抽取 质量 要 求 较 高 ;用 户 标签 的 访问 率 也 体现 了 
标 答对 于 信息 资源 表述 的 准确 度 ,基于 信息 检索 方式 
健 是 以 用 户 检索 .访问 情况 进行 标签 质量 的 评估 ;通过 
分 狼 用 户 间 的 相似 度 资源 的 匹配 度 、 标 签 的 语义 相似 
性 来 对 标签 质量 进行 评估 的 方法 考虑 了 用 户 资源 . 标 
签 世间 的 联系 ,但 对 这 三 类 资源 的 依赖 性 也 较 强 。 
5.3 ”标签 质量 的 优化 

对 社会 化 标签 质量 的 优化 有 利于 过 滤 信 任 度 低 的 
噪音 标签 ,提高 标签 应 用 质量 。 针 对 社会 化 标签 的 自 
由 性 缺陷 ,标签 质量 控制 有 4 种 方法 ,包括 在 标签 创建 
时 进行 控制 , 即 用 等 级 分 类 法 .分 面 分 类 法 控制 社会 性 
标签 ;在 浏览 标签 时 进行 控制 , 即 运用 标签 云 控制 社会 
性 标签 ;还 有 依靠 用 户 社 群 力量 ,由 用 户 群体 共同 改善 
标签 信息 。 

机 器 学 习 是 应 用 较 多 的 标签 质量 模型 优化 方法 ， 
研究 者 主要 通过 控制 同义词 和 近义词 同名 异 义 词 和 
缩写 词 ,以 及 通过 自由 标注 方法 的 用 户 引 导 , 优 化 系统 
推荐 以 及 完善 标签 管理 功能 来 弥补 标签 质量 的 缺陷 。 
现 有 关于 标签 质量 的 研究 大 多 利用 标签 的 单一 属性 。 
章 成 志 、 李 区 ”提出 综合 标签 的 内 容 属性 与 社会 化 属 
性 ,构建 了 支持 向 量 机 标签 质量 评估 模型 ,对 标签 质量 


的 机 玫 


进行 综合 评估 ; 顾 晓 雪 等 ” 通过 分 析 不 同 质量 
签 质量 的 标 


生成 标签 的 聚 类 效果 差异 ,优化 了 融合 标 
签 聚 类 算法 。 

标签 质量 取决 于 标签 与 资源 的 相关 性 ,典型 的 标 
签 相 关 性 判断 方案 包括 基于 标签 绝对 频次 和 基于 内 容 
的 相关 性 判断 策略 。 绝 对 频次 的 高 低 与 标签 相关 性 并 
不 绝对 成 正 相 关 ,而 基于 内 容 的 相关 性 判断 策略 受 限 
于 自动 标 引 策略 的 召回 率 、 策 略 准确 率 、 策 略 通用 性 。 
何 琳 等 ”通过 建立 “社会 标签 - 主题 词 " 的 概念 空间 
模型 ,提出 一 种 “内 核 受 控 ,外 党 非 控 ”的 分 类 模型 ,对 
社会 标签 进行 了 规范 控制 ,以 提高 社会 化 标签 的 质量 ; 
林 讲 .周知 ”引入 活跃 度 指数 进行 标签 相关 性 的 判 
断 , 提 高 了 关系 判断 策略 的 通用 性 。 

规范 化 社会 化 标签 是 优化 信息 组 织 和 检索 的 重要 
措施 ,在 确保 标注 质量 上 起 着 重要 作用 。 吴 丹 等 ” 对 
比分 析 中 英文 图 书 标注 与 编目 ,提出 规范 化 管理 图 书 
标签 资源 ,包括 规范 并 指导 用 户 标注 图 书 ,连接 社会 标 
签 与 主题 词 表 , 合 并 图 书 编目 生成 的 元 数据 与 图 书 标 
注 生 成 的 标签 ,建立 个 性 化 半自动 标 引 等 方法 。 也 有 
学 者 从 标签 结构 角度 对 标签 质量 进行 优化 ,以 减少 标 
签 语义 模糊 .缺乏 层次 性 等 问题 。 王 爽 等 ” 提出 引入 
用 户 分 类 标签 的 方法 ,构建 结构 性 的 Folksonomy 体系 ， 
以 体现 用 户 对 标签 及 相应 类 目 之 间 关 系 的 一 致 性 。 


sn 


6， 社 会 化 标签 的 信息 推荐 研究 
在 基于 标签 的 信息 推荐 研究 文献 中 ,标签 推荐 、 信 


息 推 荐 ,推荐 算法 推荐 系统 是 出 现 频次 较 多 的 关键 
词 ,本 部 分 将 从 标签 推荐 的 影响 因素 、 类 型 .优化 三 个 
角度 对 标签 推荐 的 相关 内 容 进 行 总 结 。 
6.1 信息 推荐 的 影响 因素 

将 用 户 迫 切 需 要 的 标签 和 资源 提供 给 用 户 是 社会 
化 标注 系统 用 户 服务 的 宗旨 与 核心 ” 。 武 慧 娟 等 ” 
从 用 户 个 性 化 角度 指出 基于 标签 的 信息 推荐 的 主要 影 
响 因素 包括 用 户 标注 行为 .用户 群 的 粒度 用户 群 中 的 
资源 。 由 于 用 户 标 注 的 自由 性 ,标签 存在 类 目 结构 局 
平 化 .语义 关系 混乱 .语义 模糊 一 义 多 词 等 问题 ,限制 
了 标签 用 于 资源 检索 和 组 织 的 能 力 “ ,进而 影响 了 基 
于 标签 的 信息 推荐 服务 的 效果 。 用 户 自主 标注 的 规范 
性 问题 影响 了 基于 本 体 研究 领域 中 对 标签 的 聚 类 效 
率 …” ,标签 的 扁平 化 结构 也 使 得 其 在 揭示 资源 主题 及 
言 息 检 索 方 面 未 被 充分 利用 。 

社会 化 标签 与 资源 间 的 动态 关系 是 标签 推荐 的 影 
响 因 素 之 一 。 社 会 化 标签 通过 同一 标签 对 不 同 资源 和 
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同一 资源 对 不 同 标签 的 聚合 作用 来 不 断 扩充 资源 主题 
和 资源 间 的 动态 联系 ,标签 的 核心 .边缘 层级 的 演化 在 
一 定 程度 上 反映 了 领域 知识 核心 热点 的 更 新 与 迭代 ， 
社会 化 标签 与 资源 之 间 的 动态 关系 使 得 标签 呈现 一 定 
的 规律 。 其 中 ,标签 使 用 量 的 “ 短 律 分 布 " 规 律 影响 着 
个 性 化 信息 推荐 效果 ,基于 社会 化 标签 的 用 户 新 兴 
的 发 掘 并 不 适用 于 基于 内 容 的 信息 推荐 。 对 于 协同 过 
滤 标 签 推荐 而 言 ,处 于 长 尾 状态 的 用 户 无 法 获得 精准 
推荐 也 是 其 所 面临 的 主要 间 题 。 针 对 图 片 . 视 频 、 音 
乐 . 网 页 等 不 同类 型 的 标注 资源 ,信息 提取 检索 方法 的 
不 同 也 影响 着 信息 推荐 的 效果 。 
6.2 ”标签 推荐 的 类 型 

常见 的 标签 推荐 包括 基于 资源 内 容 的 推荐 .协同 
过 滤 的 推荐 .基于 关联 规则 的 推荐 。 基 于 内 容 的 推荐 
主要 利用 信息 检索 方法 提取 文本 信息 特征 ,并 将 相似 
度 镶 高 的 信息 推荐 给 用 户 。 协 同 过 滤 推荐 通过 标签 预 
测 角 户 或 项 目的 邻居 节点 ,将 其 他 同类 对 象 标注 的 次 
源 胜 荐 给 目标 对 象 。 基 于 关联 规则 的 推荐 通过 提取 用 


内 喇 获 取 的 信息 资源 之 间 的 关系 对 目标 用 户 进行 类 似 
推移 ,典型 案例 如 从 客户 购买 商品 集中 挖 据 出 啤酒 与 


厌 丰 的 购买 模式 。 
武 慧 娟 等 “通过 分 析 国 外 对 个 性 化 信息 推荐 的 


了 社会 化 标签 - 评价 矩阵 方法 面临 的 * 冷 开始 “新 用 
户 ”“ 新 资源 ”等 问题 ; 徐 文 青 等 ”将 书籍 “热门 度 ” 因 
素 融 入 基于 内 容 的 推荐 算法 中 ,以 改善 图 书 个 性 化 推 

与 传统 的 协同 过 滤 算 法 相 比 ,标签 聚 类 方法 在 个 
性 化 服务 中 可 有 效 提高 推荐 服务 质量 。 标 签 聚 类 研究 
的 核心 问题 在 于 计算 标签 之 间 的 相似 度 , 以 提高 标签 
对 资源 描述 的 准确 程度 。 王 帅 腾 、 徐 宽 -综合 了 聚 类 
和 本 体 方面 的 知识 ,利用 形式 概念 分 析 方 法 将 标签 聚 
类 ,构建 基于 社会 化 标签 的 文学 图 书本 体 ,优化 了 社会 
化 标签 的 资源 整合 。 部 分 研究 者 从 用 户 角 度 进 行 聚 
类 ,来 优化 标签 描述 效果 。S，Shan 等 ”提出 依据 用 
户 标 注 行为 的 代表 性 对 用 户 进行 排名 策略 ,以 挖 气 有 
价值 的 标签 ,优化 现 有 的 个 性 化 信息 推荐 方法 ; 苏 杨 
等 利用 同义词 环 改进 原始 标签 用 户 分 类 ,将 用 户 按 
照 兴趣 进行 分 类 ,优化 基于 群 组 的 兴趣 推送 服务 ; 李 中 
慧 利用 标签 聚 类 分 析 构建 用 户 兴趣 模型 ,构建 出 基 
于 标签 的 个 性 化 信息 服务 流程 框架 ; 王 娜 等 ” 提出 融 
合 标签 权 值 的 用 户 模糊 聚 类 方法 ,通过 构建 标签 的 模 
糊 相 似 矩 阵 提取 标签 权 值 , 并 构建 标注 行为 的 模糊 相 
似 和 矩阵 ,根据 阔 值 计算 对 用 户 进行 聚 类 ,优化 了 传统 的 
模糊 聚 类 方法 。 


研究 文献 ,根据 用 户 .资源 .标签 组 织 方式 的 不 同 ,将 基 
于 标签 的 个 性 化 信息 推荐 分 为 三 类 ,包括 基于 图 论 . 基 
了 3 绷 量 和 基于 主题 模型 。 其 中 ,基于 图 论 的 模型 研究 
运 攻 图 论 的 理论 方法 刻画 标签 及 其 与 用 户 资源 之 间 
的 美 系 , 以 体现 标签 系统 中 的 网 络 结构 ;基于 张 量 的 模 
列 研究 主要 通过 构建 用 户 资源、 标签 关系 的 框架 模 
型 ,利用 理论 分 析 方法 ,从 整体 层面 对 标签 资源 进行 研 
究 ,以 优化 个 性 化 推荐 ;基于 主题 模型 的 研究 则 主要 从 
标签 语义 角度 挖掘 标签 信息 ,匹配 各 种 机 器 学 习 算法 ， 
提供 更 准确 高效 的 推荐 信息 以 满足 用 户 需求 。 
6.3 ”标签 推荐 的 优化 

在 基于 社会 化 标签 的 信息 推荐 研究 领域 ,多 种 推 
荐 方法 .资源 分 析 的 组 合 是 标签 推荐 优化 领域 中 综合 
性 较 强 的 研究 手段 。 张 亮 [9 通过 对 标签 系统 中 对 象 
关系 与 资源 内 容 的 融合 分 析 , 提出 了 基于 主题 模型 的 
推荐 方法 ; 钟 克 吟 "将 基于 用 户 的 协同 过 滤 算 法 和 基 
于 关联 资源 的 协同 过 滤 算 法 相 结合 ,运用 于 高 校 学 术 
资源 的 推荐 中 ,体现 了 协同 过 滤 对 象 的 多 样 性 ; 易 明 
等 针对 基于 资源 内 容 、 协 同 过 滤 、 关 联 规则 的 三 类 
推荐 方法 的 缺陷 提出 了 基于 社会 化 标签 网 络 的 内 容 推 
荐 和 基于 知识 互动 型 社会 网 络 的 协作 过 滤 推荐 ,解决 
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社会 化 标签 的 语义 模糊 性 和 标签 无 序 性 限制 了 标 
签 推荐 的 效率 , 词 表 在 解决 标签 主题 分 类 标签 语义 定 
位 问题 上 占据 着 重要 位 置 。 受 控 词 表 的 专业 化 、 含 义 
明确 化 特点 有 利于 规范 用 户 标 注 行为 ,提高 标签 的 检 
索 效果 。 同 时 , Folksonomy 和 受 控 词 汇 可 以 很 好 地 互 
补 , 增 加 信息 组 织 方 式 , 提 高 OPAC 系统 的 检索 结果 。 
姚 晓 锋 ”对 比分 析 用 户 标签 和 主题 分 类 的 优 缺点 , 提 
出 以 受 控 词 表 配 置 图 书馆 资源 的 方法 。 主 题词 表 的 语 
义 关系 与 标签 间 关系 具有 互 参 照 性 , 李 艳 、 贾 君 枝 ™ 
借助 受 控 词 表 中 已 有 的 语义 关系 ,制定 出 了 标签 语义 
关系 挖掘 规则 ,进而 构建 出 轻型 标签 本 体 ,以 提升 用 户 
检索 效率 。 较 之 于 图 像 视 觉 特征 分 析 , 语 义 标签 分 析 
具有 处 理 效率 上 的 优势 。 宋 灵 超 等 ” 利用 情感 词 表 ， 
提出 图 片 标签 情感 类 型 的 自动 分 类 方法 ,优化 了 基于 
情感 特征 的 图 像 检索 与 利用 。H.， Xie 等 ”提出 了 基 
于 用 户 情感 等 级 的 信息 分 析 框架 ,为 个 性 化 信息 检索 
提供 了 理论 依据 。 周 知 、 梁 宇 “ 结合 了 词 表 规 范 性 、 
示 准 化 优势 与 规则 在 自动 分 类 方面 的 能 力 , 提 出 了 结 
合 自 建 词 表 和 句法 规则 的 标签 自动 分 类 方法 ,为 基于 
示 签 的 资源 检索 推荐 提供 了 参考 。 

研究 者 也 从 其 他 角度 对 标签 推荐 的 优化 进行 了 研 
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究 。 胡 茶 海 等 "提出 涌现 语义 适用 度 及 其 在 群 偏好 
预测 中 的 应 用 模式 ,使 得 基于 知识 的 情境 敏感 性 群 仿 
好 预测 更 加 精准 ,提升 了 移动 场景 中 面向 群体 的 信息 
资源 推送 服务 的 质量 ; 胡 潜 等 .通过 日 志 分 析 法 调用 
豆瓣 网 图 书 标 注 数据 ,指出 图 书 主题 对 用 户 标 签 个 数 、 
类 型 分 布 有 显著 影响 ,为 图 书 分 面 检索 和 标签 推荐 设 
计 提 供 了 参考 。 


7， 社 会 化 标注 系统 的 检索 研究 
通过 阅读 文献 得 知 ,我 国 图 情 领域 学 者 对 标签 检 


索 的 研究 主要 从 社会 化 标注 系统 的 标签 检索 出 发 , 限 
于 文献 量 较 少 ,本 部 分 将 从 社会 化 标注 系统 的 标签 语 


送 , 对 用 户 行为 的 跟 足 与 判断 ,用户 兴 趣 的 宏观 把 控 ， 
有 利于 提高 个 性 化 服务 的 针对 性 、 精 准 性 、 及 时 性 。 
7.3 基于 标签 的 检索 技术 

社会 化 标注 系统 的 信息 检索 技术 包括 标签 相关 性 
排序 技术 标签 本 体 技术 、 个 性 化 标签 搜寻 技术 、 多 媒 
体 标签 检索 技术 个 性 化 标签 推荐 技术 ,标签 词义 消 歧 
技术 垃圾 标签 的 消除 技术 以 及 标签 聚 类 技术 等 , 徐 志 
玮 等 “ 对 标签 相关 性 排序 、 标 签 本 体 、. 个 性 化 标签 搜 
寻 、 多 媒体 标签 检索 等 技术 进行 了 阐述 。 基 于 链接 分 
析 的 网 页 排序 算法 、 以 向 量 空间 模型 和 统计 模型 的 聚 
类 算法 、 倒 排 索引 是 目前 主要 的 标签 相关 性 技术 。 研 
究 者 利用 本 体 对 大 众 分 类 法 进行 表示 或 分 析 , 以 解决 


义 检 索 .检索 功能 、 检 索 技术 三 个 方面 对 标签 检索 研究 
进 每 简要 综述 。 

7. 和 用 基于 标签 的 语义 检索 

看 义 检索 是 基于 知识 与 语义 的 匹配 ,研究 者 多 通 
撕 强 标签 的 语义 信息 来 提供 社会 化 标注 系统 的 信息 
和 村 能 力 。 标 签 语义 检索 研究 包括 扩展 标签 语义 与 涌 


fe 


Yi 


杨 签 语义 两 个 方面 ,其 中 扩展 标签 语义 研究 主要 通 
站 


; 尘 


yg 
利用 语义 工具 .本体 技术 对 标签 资源 语义 关系 进行 
联 或 分 析 ,涌现 标签 语义 研究 领域 主要 利用 概率 论 、 


图 珍 , 共 现 网 络 等 方法 挖掘 标签 资源 的 潜在 语义 。 宣 
式 神 等 1 提出 基于 潜在 语义 分 析 的 社会 化 标注 系统 
标签 语义 检索 模型 ,改进 了 标签 - 资源 矩阵 权重 计算 
请 和 ,以 提高 标签 语义 检索 效率 ; 陈 朝 “ 在 Folksonomy 
标 颖 深度 语义 与 广度 语义 聚合 流程 基础 上 ,综合 运用 
语 区 描述 方法 和 复杂 网 络 可 视 化 图 谱 揭 示 双 维度 的 标 
领 河 义 聚 合 过 程 ,以 此 提出 具备 广泛 视角 的 Folkson- 
omy 导航 架构 。 
7.2 ”基于 标签 的 检索 功能 

社会 化 标注 系统 是 连接 用 户 .标签 资源 的 网 络 平 
台 , 为 用 户 提供 对 网 络 资源 进行 自由 分 类 ,标注 的 权 
限 ,是 一 种 以 用 户 为 导向 的 信息 组 织 管理 系统 。 社 会 
化 标注 系统 的 三 大 检索 功能 包括 词语 检索 .浏览 检索 
和 个 性 化 信息 推荐 。 用 户 通过 关键 词 标签 词 或 关键 
词 与 标签 词 的 联合 进行 基于 词语 的 检索 ,但 受 标签 . 关 


ee 


和 = 


pp: 


标签 平面 性 、 稀 下 性 所 带 来 的 标签 信息 检索 低 效 率 的 
问题 ,但 由 于 标签 本 体 构 建成 本 较 高 ,也 有 学 者 借助 在 
线 词 表 、 叙 词 表 等 本 体 工 具 对 标签 进行 层次 化 .查询 扩 
展 等 研究 。 社 会 化 标注 系统 的 个 性 化 搜寻 主要 体现 在 
推荐 系统 上 ,包括 标签 推荐 、 自 由 推荐 .相似 用 户 推 荐 ， 
示 签 共 现 .协同 过 滤 标签 查询 扩展 等 被 应 用 于 个 性 化 
推荐 中 ,以 满足 用 户 个 性 化 搜寻 需求 。 针 对 图 像 的 标 
签 检索 是 社会 化 多 媒体 标签 检索 技术 研究 较 多 的 话 
题 , 通 过 改善 传统 的 基于 文本 和 基于 内 容 的 图 像 检 索 
方式 ,研究 者 们 综合 图 像 可 视 化 和 标签 共 现 算法 对 图 像 
进行 自动 标注 ,利用 标签 相关 性 对 图 像 进行 排序 ,运用 
本 体 、 在 线 词 表 、 地 理 位置 等 对 图 片 标签 检索 进行 研究 。 
也 有 学 者 将 图 数据 库 技术 应 用 于 标签 检索 系统 
中 。 王 慧 孜 等 “ 将 图 数据 库 应 用 于 标签 系统 的 数据 
管理 与 利用 上 ,构建 了 标签 系统 的 图 数据 模型 ,通过 采 
集 Flicker API 图 片 数据 构建 标签 系统 ,使 用 图 数据 库 
语法 即 可 构造 多 维度 的 检索 分 析 并 获取 可 视 化 网 络 
图 。 在 处 理 标签 资源 上 ,基于 图 数据 库 的 标签 检索 的 
多 维 性 .灵活 性 明显 优 于 关系 数据 库 。 


通过 对 我 国 图 书馆 与 情报 学 科 领 域 的 社会 化 标签 
研究 期 刊 文 献 的 调查 ,笔者 对 社会 化 标签 发 展 情况 . 研 
究 热点 进行 了 总 结 , 并 从 标签 应 用 ,标签 信 息 、 标 签 质 


键 词 质量 的 影响 ,词语 检索 的 精细 化 程度 不 够 ,词语 检 
索 的 多 样 性 及 信息 查 全 率 、 查 准 率 均 受 到 限制 。 浏 览 
检索 包括 主题 导航 ,标签 导航 等 ,以 导航 栏 标签 云 等 
形式 展示 给 用 户 , 其 主要 在 用 户 浏览 信息 的 过 程 中 向 
用 户 推荐 资源 或 用 户 群 ,由 于 浏览 检索 的 随意 性 ,其 不 
具有 固定 的 检索 效果 评 佑 标准。 个 性 化 信息 推荐 包括 
信息 资源 的 推荐 .标签 推荐 、 相 似 用 户 推 荐 和 信息 推 


量 \ 信 息 推荐 \ 信 息 检索 角度 对 学 者 研究 问题 和 方法 进 
行 阐述 ,分 析 了 各 领域 的 研究 现状 或 不 足 , 为 图 情 领 域 
社会 化 标签 研究 或 系统 优化 工作 提供 参考 依据 。 
8.1 研究 现状 总 结 

对 社会 化 标签 的 研究 综述 主要 集中 在 2012 至 
2015 年 间 ,学 者 们 主要 从 标签 应 用 、 研 究 话题 .文献 分 
布 等 角度 进行 总 结 分 析 。 样 本 文献 中 最 早 对 社会 标签 
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进行 综述 分 析 的 是 翟 爽 , 宋 文 所 著 的 《社会 标签 进展 研 
究 概 述 》, 该 研究 将 社会 标签 作为 一 种 新 的 信息 组 织 

式 ,概述 了 社会 标签 的 应 用 进展 及 与 知识 组 织 体系 的 
融合 研究 。 张 从 垦 . 张 云 中 对 CNKI 数据 库 中 
2006 -2015 年 间 国 内 Folksonomy 期 刊 文 献 进行 共 词 
分 析 ,通过 构建 相 异 和 矩阵 、 聚 类 分 析 和 多 维 尺度 分 析 ， 
综述 了 信息 组 织 . 知 识 发 现 、 标 注 系统 、 标 签 应 用 、 本 
体 .标签 推荐 等 方面 的 研究 热点 。 近 期 较为 全 面 的 综 
述 研究 是 刘 庆 旭 、 毕 强 发 表 的 《国内 外 Folksonomy 研究 
综述 》 ,文章 对 比分 析 了 2004 - 2015 年 间 国内 外 Folk- 
sonomy 理论 研究 .技术 研究 .实践 应 用 研究 情况 ,指出 
国内 针对 分 众 分 类 理论 研究 的 不 完善 ,技术 创新 .系统 
应 用 等 方面 还 有 待 丰富 等 问题 。 综 合 分 析 我 国 图 情 领 
域 社会 化 标签 综述 研究 文献 可 知 , 现 有 研究 多 从 宏观 
社会 和 学 术 层面 对 社会 化 标签 进行 羡 述 分 析 , 而 专门 
久 双 我 国 图 书 情报 学 科 领 域 研究 方向 的 社会 化 标签 研 
客 纤 述 并 不 多 见 。 笔 者 选用 依据 文献 量 分 布 情况 获取 
研 驶 话题 的 方式 进行 综述 研究 框架 的 设计 ,通过 对 我 
国 图 情 领 域 社会 化 标签 研究 文献 的 量化 分 析 结 果 得 
知 际 签 应 用 .标签 信息 ,标签 质量 .信息 推荐 等 是 我 国 

领域 社会 化 标签 主要 的 研究 内 容 。 

@ 〇 研究 者 多 采取 案例 调查 法 对 社会 化 标签 的 应 用 现 
状 混 行 研究 ,通过 实例 调查 或 数据 对 比 发 气相 关 应 用 
问题 ,并 根据 不 同 场景 或 理论 基础 提出 解决 方案 。 与 
标 县 应 用 研究 密切 相关 的 研究 话题 包括 标签 云 .主题 
图 (图 书馆 学科 导航 ,社会 化 标注 系统 等 ,研究 者 们 多 
通过 探讨 现 有 标签 应 用 体系 的 优化 或 完善 方法 ,来 提 
高 标签 服务 质量 。 典 型 的 社会 化 标签 应 用 平台 包括 
Flicker 网 站 ,Bibsonomy. org 网 站 、 豆 办 电影 豆 办 图 书 、 
知 乎 话题 .科学 网 博客 .中 国 知 网 ,高校 图 书馆 资源 等 
网 络 平台 ,这 些 也 是 标签 应 用 研究 中 考察 较 多 的 研究 
对 象 。 标 签 信息 的 研究 从 复杂 网 络 ,本 体 等 角度 进行 
研究 ,以 探讨 标签 间 的 关系 与 深层 语义 信息 。 基 于 标 
签 的 信息 推荐 研究 主要 采用 模型 构建 的 方法 ,通过 构 
建 理论 模型 ,加 以 数据 验证 ,优化 现 有 的 信息 推荐 服 


角度 进行 研究 。 
8.2 现 有 研究 特点 及 不 足 

在 对 文献 研究 进行 总 结 分 析 的 过 程 中 ,发现 我 
图 情 领域 对 社会 化 标签 的 研究 特征 及 问题 有 所 显现 。 

在 标签 应 用 研究 层面 ,以 本 体 的 形式 或 本 体 的 相 
关 理 论 来 研究 标签 信息 及 标签 之 间 的 语义 关系 是 大 多 
数 文献 选取 的 研究 方法 ,将 本 体 与 社会 化 标签 的 实际 
应 用 相 结合 的 研究 是 此 领域 的 空缺 。 基 于 本 体 理论 的 
社会 化 标签 研究 在 实际 应 用 中 的 验证 分 析 也 沿 显 不 
足 。 此 外 ,高 校 图 书馆 在 图 情 领域 的 标签 应 用 研究 中 
出 现 频次 较 多 ,但 目前 标签 应 用 水 平 仍然 远 不 及 网 络 
社交 平台 ,体现 了 应 用 研究 在 教育 领域 的 应 用 实效 性 
不 强 。 作 者 对 此 情况 的 原因 进行 深入 分 析 后 发 现 , 除 
了 参与 图 情 领域 社会 化 标签 标注 工作 的 人 员 偏 少 这 一 
表面 原因 之 外 ,更 深层 的 原因 是 本 体 方法 与 社会 化 标 
签 之 间 存 在 “语义 鸿沟 ”。 社 会 化 标签 本 质 上 是 用 户 
各 自 对 事物 的 局 部 认识 ,而 传统 的 本 体 方法 要 求 对 事 
物 有 一 个 一 臻 全面 的 语义 描述 。 这 种 深层 次 的 隔 半 
使 得 社会 化 标签 方法 难以 在 关注 知识 本 体 分 类 研究 的 
传统 图 情 专业 领域 中 获得 广泛 认可 和 应 用 。 

在 标签 推荐 层面 , 较 多 学 者 提出 了 如 何 将 新 标签 
归纳 到 现 有 的 标签 体系 以 及 如 何 将 非 稳定 状态 下 的 用 
户 兴 趣 与 标签 体系 相 匹 配 以 精准 化 信息 推荐 的 问题 ， 
新 标签 的 自动 融入 与 用 户 兴趣 的 变化 都 对 标签 推荐 的 
时 效 性 和 准确 性 要 求 均 较 高 ,这 也 是 目前 基于 标签 的 
信息 推荐 系统 在 满足 用 户 个 性 化 信息 需求 过 程 中 吸 待 
解决 的 。 对 于 标签 融入 的 问题 ,作者 经 过 分 析 后 认为 ， 
其 根源 在 于 标签 所 蕴含 的 语义 信息 的 表示 和 组 织 方 
法 。 社 会 化 标签 是 一 种 灵活 的 、 非 标准 的 语义 信息 表 
达 形 式 ,新 的 标签 被 提出 时 ,其 蕴含 的 语义 信息 需要 与 
底层 的 语义 信息 组 织 的 框架 相 融 合 , 才 能 够 得 到 有 效 
的 推荐 。 当 前 社会 化 标签 的 研究 普遍 关注 标签 推荐 的 
现象 问题 ,但 较 少 深入 探讨 其 内 部 语义 信息 组 织 结构 
和 演化 方法 对 标签 推荐 的 影响 。 

在 标签 质量 研究 层面 ,研究 者 多 采用 豆 办 网 博客 


务 ,也 有 学 者 从 标签 聚 类 .系统 动力 学 模型 .主题 模型 、 
本 体 .协同 过 滤 算 法 等 角度 提出 了 信息 推荐 优化 策略 。 
研究 者 主要 基于 社会 化 标注 系统 对 标签 检索 的 相关 内 
容 进行 分 析 ,通过 优化 检索 功能 、 检 索 技 术 , 以 完善 现 
有 的 标签 检索 。 与 基于 社会 化 标签 的 信息 推荐 .信息 


网 . 知 乎 高 校 图 书馆 等 常见 的 社会 化 标签 分 析 对 象 ， 
在 一 定 层面 上 使 得 研究 成 果 有 一 定 的 对 比 性 和 参考 
性 ,但 单一 大众化 的 研究 样本 ,加 之 标签 质量 研究 模 
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Main Problems Analysis on the Research of Social Tags in LIS 
LiXuhui Li Yuanyuan Ma Feicheng'” 
' School of Information Management, Wuhan University, Wuhan 430072 
“Center for the Studies of Information Resources of Wuhan University, Wuhan 430072 

Abstract: [Purpose/significance | Social tag is one of the hot topic in the field of library and information science in 
China. In recent years of the development process, the research of social tags expands to information quality, information 
retrieve, information recommendation, and some other research areas in LIS. The study or discussion on the research pro- 
gress of tags in LIS will serve as a theoretical underpinning for the research on social tags in future. [ Method/process| 
By analyzing the papers in the field of library and information science during the year 2010 to 2017 with CiteSpace, this 
paper visualizes the hot topics, development process and general tendency of research on social tags, and described the 
theme in detail from five points of practical application, including information analysis, quality assessment, information 
recommendation, and information retrieve. [ Result/conclusion | Based on the situation and problems of social tags” re- 
seu1Th, some relevant suggestions are proposed, including expanding the research scopes of social tags in the field of ontol- 


ogyeand information retrieve, emphasizing user-centered design to meet the personalized needs, applying the theoretical 


nto practice, and so on. 


Keywords: social tags library science information science 


2018 数据 管理 与 服务 学 术 研讨 会 通知 


导数 据 是 科学 范式 转变 的 最 主要 的 驱动 因素 ,是 21 世纪 最 重要 的 信息 资源 。 随 着 大 数据 时 代 的 到 来 , 随 着 数据 管理 和 服务 新 模式 的 出 现 ， 
的 作用 和 影响 将 会 日 益 显 现 。 对 图 书馆 而 言 ,如 何 有 效 地 收集 组织 ,关联 挖掘 ,利用 数据 ,不 仅 是 图 书馆 发 展 的 新 任务 与 新 挑战 ,更 是 图 

挤 访 新 时 代 服 务 能 力 的 重要 体现 。 
3 在 此 背景 下 ,《 图 书 情报 工作 》 杂 志 社 与 重庆 市 高 校 图 书 情报 工作 委员 会 联合 主办 ,重庆 大 学 图 书馆 承办 ,于 2018 年 10 月 31 日 -11 月 2 
量 在 重庆 举办 “数据 管理 与 服务 学 术 研 讨 会 ”, 探 讨 数据 管理 与 服务 中 的 理论 问题 与 实践 策略 ,搭建 专家 学 者 与 业界 同行 专业 交流 的 平台 。 欢 
迎 爹 和 败 各 级 各 类 图 书 情报 人 员 .相关 技术 人 员 .大 学 师 生 参 会 。 


(器 、 会 议 主题 与 分 主题 会 议 注 册 费 交 费 方式 : 
人 主题 :数据 管理 与 服务 1 \ 提 前 通过 单位 公 对 公转 账 (2018 年 10 月 15 日 前 转账 可 在 会 
: 议 现场 领取 发 票 ) 
据 管理 与 服务 相关 技术 与 应 用 账户 信息 :开户 行 :中 国 建设 银行 股份 有 限 公 司 中 关 村 分 行 
学 数据 管理 与 服务 研究 与 实践 进展 账号 :11001007300059261059 
理 与 服务 的 最 佳 实践 款 单 位 :《 图 书 情报 工作 了》 杂志 社 
文 与 数据 出 版 2 会 议 现场 交 现金 (会 后 快递 发 票 ) 
析 ,挖掘 与 知识 发 现 3 .会议 现场 刷 公 务 卡 ( 会 后 快递 发 票 ) 
据 馆 员 与 能 力 建 设 六 、 会 议 报名 


报名 方式 :扫描 下 方 二 维 码 报名 


二 、 会 议 安 排 
会 议 将 邀请 多 名 知名 专家 学 者 与 参 会 人 员 分享 与 互动 。 
三 会议 组 织 机 构 
主办 单位 区 《图 书 情 报 工作 》 杂 志和 社 
重庆 市 高 校 图 书 情报 工作 委员 会 
承办 单位 :重庆 大 学 图 书馆 
四 、 会 议 时 间 、 地 点 
会 议 时 间 :2018 年 11 月 1 日 (10 月 31 日 报到 ,11 月 2 日 疏散 ) 七 、 联 系 方式 
报名 截止 时 间 :2018 年 10 月 15 日 。 联系 人 : 周 老师 
报到 酒店 :重庆 富力 假日 酒店 ( 单 住 390 元 / 晚 , 合 住 床位 195 联系 电话 :13072355789 
元 / 晚 ) 电子 邮件 :red@ cqu. edu. cn 
会 议 地 点 :重庆 大 学 虎 溪 图 书馆 学 术 报 告 厅 。 请 报名 参 会 的 老师 加 入 图 书 情报 工作 QQ 群 :3237 32873 ,会 议 
五 .费用 和 食 宿 相关 信息 在 此 发 布 。 


《图 书 情 报 工作 》 杂 志 社 


会 议 费 :9 月 15 日 前 汇款 缴费 800 元 /人 ,9 月 15 日 后 汇款 及 现 
2018 年 6 月 28 日 


场 缴费 1000 元 /人 。( 交 通 、 住 宿 费 用 自理 。) 
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